开源项目,开源代码,开源文档,开源新闻,开源社区

P20

摘要MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/valuepair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。

wujianhai 2011-11-26 5219 0

Go

P20

MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。

suncf1985 2014-05-08 305 0

分布式/云计算/大数据

MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。

fmms 2012-02-08 280103 0

MapReduce 分布式/云计算/大数据

Google 十年前宣布了分布式大数据集处理系统 MapReduce，推动了 Hadoop 等大数据分析系统的出现。在刚刚举行的 Google I/O大会上，搜索巨人宣布了 MapReduce 的继任者 Gloud Dataflow。

jopen 2014-06-26 9184 0

Gloud Dataflow

将自己用C++开发的MapReduce框架 MapReduce for C（MR4C）开源，此举可给Hadoop社区带来福音，因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。

jopen 2015-02-24 25467 0

MapReduce

P16

MapReduce的原理Hadoop中的MapReduce是一个使用简易的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业（job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式处理它们。框架会对map的输出先进行排序，然后把结果输入给reduce任务。通常作业的输入和输出都会被存储在文件系统中。

hhy5277 2013-01-18 884 0

分布式/云计算/大数据

P16

MapReduce 的原理。Hadoop中的MapReduce是一个使用简易的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业（job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式处理它们。框架会对map的输出先进行排序，然后把结果输入给reduce任务。通常作业的输入和输出都会被存储在文件系统中。整个框架负责任务的调度和监控，以及重新执行已经失败的任务。

kanmars 2012-11-05 3974 0

分布式/云计算/大数据

P19

在输入数据的“逻辑”记录上应用Map操作得出一个中间Key/value pair集合。在所有具有相同key值的value值上应用Reduce操作，从而达到合并中间的数据，得到一个想要的结果的目的

loyoo 2012-08-28 2554 0

Hadoop 分布式/云计算/大数据 Go ini

P4

什么是 MapReduce Hadoop Map/Reduce是一个使用简易的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。

singing 2014-01-09 2559 0

分布式/云计算/大数据

P16

Hadoop中的MapReduce是一个使用简易的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业（job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式处理它们。框架会对map的输出先进行排序，然后把结果输入给reduce任务。

banny 2014-04-09 285 0

近日，Apache软件基金会宣布， Apache Beam 成功孵化，成为该基金会的一个新的顶级项目，基于Apache V2许可证开源。

ShaniHodgso 2017-03-10 13568 0

MapReduce 分布式/云计算/大数据 Apache Beam

MapReduce 是 Google 在 2004 年发布的一个软件框架，用于支持大规模数据的分布式计算。 MongoDB 是一个开源的面向文档的 NoSQL 数据库系统，使用 C++ 编写。

openkk 2012-02-12 63141 0

MongoDB MapReduce NoSQL数据库

MapReduce是聚合工具的明星。Count、distinct、group能做的上述事情，MapReduce都能做。它是一个能轻松并行化到多个服务器的聚合方法。它会拆分问题，再将各个部分发送到不同的机器上，让每台机器都完成一部分。当所有的机器都完成的时候，再把结果汇集起来形成最终完整的结果。

jopen 2014-03-05 29621 0

MongoDB NoSQL数据库

小试牛刀，将mapreduce的输出结果保存到大型分布式数据库中HBase中，一个例子，求各url的访问pv数据,由于用到rcfile格式需要导入hive-exce包，还需要加载hbase包，如果这两个包都已经被集群管理员放到各节点的hadoop/lib下那就可以省去这一步，废话不说，干货

openkk 2012-08-26 34241 0

分布式/云计算/大数据 HBase

MapReduce简单使用

dgy7 2015-05-21 17403 0

MapReduce 分布式/云计算/大数据

MapReduce 图解流程

jopen 2016-01-18 12026 0

分布式/云计算/大数据

P28

内容：MapReduce概述,MapReduce的数据流,检查点,相关编程要点,Map过程Map过程通过在输入列表中的每一项执行函数，生成一系列的输出列表。Reduce过程Reduce过程在一个输入的列表进行扫描工作，随后生成一个聚集值，作为最后的输出MapReduce的Reduce过程所有不同的颜色代表不同的键值（keys）。

slayerlyy 2011-11-22 4450 0

Hadoop 分布式/云计算/大数据 Java

＂数据去重＂主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。

jopen 2013-12-25 16798 0

MapReduce 分布式/云计算/大数据

MapReduce原理与设计思想

jopen 2014-12-04 32865 0

MapReduce

P36

Hadoop 源起: Apache Lucene 开源的高性能全文检索工具包 Apache Nutch 开源的 Web 搜索引擎 Google 三大论文 MapReduce / GFS / BigTable Apache Hadoop 大规模数据处理 Hadoop 核心: Hadoop Common 分布式文件系统HDFS MapReduce框架

jphnny 2016-06-28 3381 0

Hadoop 分布式/云计算/大数据报告 Apache Go

Google MapReduce中文版文档

Google MapReduce中文版文档

谷歌三大核心技术（二）Google MapReduce中文版经验

Google用Gloud Dataflow替代MapReduce 资讯

Google开源C/C++版MapReduce框架资讯

MapReduce 的原理文档

MapReduce 的原理文档

MapReduce与Hadoop 文档

MapReduce 实例文档

MapReduce的原理文档

为什么Google用Apache Beam彻底替换掉MapReduce 经验

用MongoDB实现MapReduce 经验

在MongoDB中使用MapReduce 经验

Hbase基于Mapreduce的编程经验

MapReduce简单使用经验

MapReduce 图解流程经验

Hadoop下MapReduce编程文档

MapReduce初级案例经验

MapReduce原理与设计思想经验

Hadoop / MapReduce讨论与学习文档

Google MapReduce 的相关搜索

关键词

Google MapReduce中文版 文档

Google MapReduce中文版 文档

谷歌三大核心技术（二）Google MapReduce中文版 经验

Google用Gloud Dataflow替代MapReduce 资讯

Google开源C/C++版MapReduce框架 资讯

MapReduce 的原理 文档

MapReduce 的原理 文档

MapReduce与Hadoop 文档

MapReduce 实例 文档

MapReduce的原理 文档

为什么Google用Apache Beam彻底替换掉MapReduce 经验

用MongoDB实现MapReduce 经验

在MongoDB中使用MapReduce 经验

Hbase基于Mapreduce的编程 经验

MapReduce简单使用 经验

MapReduce 图解流程 经验

Hadoop下MapReduce编程 文档

MapReduce初级案例 经验

MapReduce原理与设计思想 经验

Hadoop / MapReduce 讨论与学习 文档

Google MapReduce 的相关搜索

关键词

Google MapReduce中文版文档

Google MapReduce中文版文档

谷歌三大核心技术（二）Google MapReduce中文版经验

Google开源C/C++版MapReduce框架资讯

MapReduce 的原理文档

MapReduce 的原理文档

MapReduce 实例文档

MapReduce的原理文档

Hbase基于Mapreduce的编程经验

MapReduce简单使用经验

MapReduce 图解流程经验

Hadoop下MapReduce编程文档

MapReduce初级案例经验

MapReduce原理与设计思想经验

Hadoop / MapReduce讨论与学习文档